1
토큰화와 시퀀스
EvoClass-AI004Lecture 4
0
🤖
삐빅! 반갑습니다, 부대원! 아래 하위 주제를 선택하여 인공지능이 토큰화를 통해 어떻게 "읽는지" 살펴보세요.
파이봇 명령실시간
삐빅!안녕하세요, 부대원! 인공지능이 읽을 수 있도록 가르치기 위해, 먼저 단어를 작은 "레고" 조각처럼 자르는 과정이 필요합니다. 컴퓨터가 단어를 숫자로 바꾸는 방식을 배우고 싶으신가요?
주제 진행 상황0%
좋은 선택입니다! 토큰은 레고 블록과 같습니다. "친구십"과 같은 단어는 "친구"와 "선박"처럼 더 작은 부분으로 나뉩니다. 단순한 "."도 토큰이 될 수 있습니다! 인공지능에게는 이런 조각들이 전체 긴 문장보다 다루기 쉽습니다.
1
하위 주제 1
무엇이 토큰인가요?
"친구"와 "선박" 같은 작은 빌딩 블록으로 텍스트를 자르는 것
이것을 보세요! 토큰을 확보하면, 인공지능은 각각에 비밀번호 같은 고유 식별 번호를 부여합니다. 이 숫자들은 "시퀀스"를 형성합니다. 기억하세요: 순서가 중요합니다! "개가 사람을 물었다"와 "사람이 개를 물었다"는 동일한 블록을 사용하지만, 시퀀스는 완전히 다른 이야기를 전달합니다!
2
하위 주제 2
시퀀스의 힘
순서가 전부인 수학적 목록으로 블록을 변환하는 것
알고 계셨나요? 인공지능에는 "컨텍스트 윈도우"라는 것이 있는데, 마치 손 크기와 같습니다. 처음 부분을 잊기 시작하기 전까지 한 번에 특정 수의 토큰만 "기억"할 수 있습니다!
알고 계셨나요?
인공지능에는 "컨텍스트 윈도우"라는 것이 있는데, 마치 손 크기와 같습니다. 처음 부분을 잊기 시작하기 전까지 한 번에 특정 수의 토큰만 "기억"할 수 있습니다!
로딩 중...
⭐⭐⭐
미션 완료!
당신은 토큰 마스터입니다!